Workshop AI ieni

Simpel Neuraal netwerk: Hidden layer

Je hebt waarschijnlijk gemerkt in de vorige opdracht dat de spiraal dataset niet lukt met de beschikbare middelen. Het patroon is te complex. We gaan nu gebruik maken van zogenaamde "hidden layers". Dit zijn extra lagen tussen de input en output. Deze lagen zijn onzichtbaar voor de buitenwereld. Om te begrijpen wat hier het nut van is moeten we eerst iets beter begrijpen wat het neurale netwerk precies doet zonder die extra lagen.

Iedere keer dat een punt wordt geclassificeerd wordt er een lineaire combinatie van input gebruikt. Iedere input (I) heeft zijn eigen weight(w) die uitgebeeld wordt door de lijntjes. Dat gaat als volgt:

output = w₁*I₁+w₂*I₂+w₃*I₃+w₄*I₄+w₅*I₅+w₆*I₆+w₇*I₇+ een constante

Wat we nu gaan doen is deze formule niet rechtstreeks naar de output sturen, maar naar een hidden neuron, dan krijgen we:

hidden neuron = w₁*I₁+w₂*I₂+w₃*I₃+w₄*I₄+w₅*I₅+w₆*I₆+w₇*I₇+ een constante

We doen dit niet één keer, maar meerdere keren, voor meerdere neuronen. Ieder neuron gebruikt dus deze formule. Daarna maken we een lineaire combinatie met de waarde van elk neuron (n) die naar de output gaat:

output = w₁*n₁+w₂*n₂+w₃*n₃+w₄*n₄+w₅*n₅+w₆*n₆+w₇*n₇+ een constante

Dit neemt aan dat we maar één hidden layer hebben. Je kunt je voorstellen dat je op deze manier hele complexe patronen kunt maken en dat je ook veel meer weights hebt die je moet trainen.

Opdracht

Probeer nu opnieuw de spiraal te classificeren. Beantwoord daarbij de volgende vragen.

Wat is het minimale aantal hidden layers dat je nodig hebt voor een correcte classificatie?
Hoeveel neuronen gebruik je dan per hidden layer?
Welke input heb je minimaal nodig om dit voor elkaar te krijgen (experimenteer hiermee).
Wat is het gevolg als je meer hidden layers gebruikt dan je nodig hebt?